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4) Promoteur modlfle pour ARN polymerase, sa preparation et ses applications. 



£7) Oligonucleotide utiiisable comma brin non-matrice de 
promoteur, dans la transcription d'une sequence d'une ci- 
ble nucleotidique, en presence d'une ARN polymerase 
phagique cholsie parmi cedes des phages dont les ARN 
polymerases ont des promoteurs speclflaues comprenant 
una sequence consensus au moins depuls la position -17 
jusqu'a la position -1 , caracterlse par le fait 

- qu'il comprend una sequence de coeur flanquee a I'une 
au moins de ses extremites d'une sequence nucleotidique 
capable d'hybridation avec une sequence de la clble, 

- que ladite sequence de ccsur est constitute par une se- 
quence de 6 a 9 nucleotides consecutifs choisis dans la re- 
gion -12 a -4 du brin non-matrice dudit promoteur specifi- 
que, ou une sequence sutfisamment homologue 
permettant de conserver la fonctionnallte de ladite ARN po- 
lymerase, 

. qi/une sequence flanquante est complements re d une 
premiere region de la cible, et que I'autre sequence flan- 
quante, lorsqu'elle est presente, est complementaires 
d'une seconde region de la cible, lesdites premiere et se- 
conde regions etant separees, sur la cible, par une se- 

3uence ayant un nombre de nucleotides egal au nombre 
e nucleotides de la sequence de coeur, 

- et que le nombre de nucleotides de la region flan- 
quante, ou la somme du nombre de nucleotides des re- 
gions flanquantes, est au moins sutfisamment eleve pour 
que led it oligonucleotide pulsse s'hybrlder avec la cibie a la 



temperature d'utilisation de I'ARN polymerase. 

Un tel oligonucleotide permet dlnitler la transcription en 
un site de la cible qui n'est normalement pas un site d'initia- 
tlon de la transcription pour ladite ARN polymerase. 
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La presente invention a pour objet un promoteur modifie pour ARN polymerase et ses 
applications. Plus particulierement, elle concerne l*utilisation d'un promoteur pour les ARN 
polymerases phagiques, ce promoteur etant modifie par rapport aux promoteurs presents dans la 
nature ou deja decrits. On a decouvert qu'il est possible de reduire la taille de la sequence 
5 promotrice et d'integrer des mesappariements entre les deux brins du promoteur. Les promoteurs 
modifies obtenus selon ['invention permettent notamment tfeffectuer la transcription d'une cible 
nucleotidique a partir d'un site qui n'est normalement par un site d'initiation de la transcription 
pour TARN polymerase utilisee. Grace a l'invention, il devient possible de transcrire in vitro des 
sequences tres diverses qui ne sont pas transcrites par les ARN polymerases phagiques lorsqu'on 
10 utilise les promoteurs de type sauvage (c'est-a-dire les promoteurs naturels) desdites ARN 
polymerases, ^utilisation de ces promoteurs modifies permet de plus d'obtenir differentes 
efficacites d f initiation de la transcription pour la transcription differentielle de plusieurs sequences 
au sein d'un meme milieu react ionnel. 

On sait que TARN (acide ribonucleique) est le produit de transcription d'une molecule 
15 f d'ADN (acide desoxyribonucleique) synthetise sous Taction d ? une enzyme, TARN polymerase 
ADN dependante. 

II est interessant a plusieurs titres de pouvoir, a partir d'une sequence d'ADN, obtenir 
plusieurs sequences d'ARN. Differentes applications de Tobtention de sequences d'ARN 
specifiques ont deja decrites, comme par exemple la synthese de sondes ARN, ou 

20 d'oligoribonucleotides (voir notamment Milligan, J. F., Groebe, D. R., Witherell, G. W., and 
Uhlenbeck, O. C. (1987) Nucleic Acids Res. 25, 8783-8798), ou l'expression de genes (voir 
notamment Steen, R. et al. (1986) EMBOJ. 5, 1099-1 103 et Fuerst, T. R et al. (1987) Molecular 
and Cellular Probes 7, 2538-2544 et les demandes de brevet WO 91 05 866 et EP 0178 863), ou 
encore Tamplification de gene comme decrit par Kievits, T. et al. {Journal of Virological 

25 Methods 35, 273-286 (1991)) et Kwoh, D. Y. et al {Proc. Natl. Acad Set. USA 86, 1 173-1 177 
(1989)) ou dans les demandes de brevet WO 88 10315 et WO 91 02818. 

L'une des caracteristiques propres aux ARN polymerases ADN dependantes est 
d'initier la synthese d'ARN suivant une matrice ADN a partir d'un site particulier d'initiation grace 
a la reconnaissance d'une sequence d'acide nucleique, appelee promoteur, qui permet de definir la 

30 localisation precise et le brin sur lequel rinitiation doit etre effectuee. Contrairement aux ADN 
polymerases ADN dependantes, la polymerisation par les ARN polymerases ADN dependantes 
n'est pas initiee a partir d'une extremite 3'OH, et leur substrat naturel est un double brin d'ADN 
intact. 

On definit ci-apres quelques termes generiques qui vont etre employes. 

35 Par oligonucleotide ou polynucleotide, on entend des sequences nucleotidiques 

contenant les bases naturelles (A, C, G, T, U) et/ou une ou plusieurs bases modifiees, telles que 
l'inosine, la methyl-5-desoxycytidine, la desoxyuridine, la dimethylamino-5-desoxyuridine, la 
diamino-2,6-purine, la bromo-5-desoxyuridine ou toutes bases modifiees, permettant I'hybridation, 
en particulier par toutes modifications chimiques appropriees permettant d'accroitre le rendement 

40 d'hybridation. Des exemples de telles modifications sont notamment Introduction entre au moins 
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deux nucleotides d'un groupement choisi parmi les esters diphosphates d'alkyl- et/ou d'aryl- 
phosphonates et/ou phosphorothioates, ou le remplacement d'au moins un sucre (ribose ou 
desoxyribose) par un polyamide ; voir par exemple Nielsen P.E. et al., Science, 254, 1497-1500 
(1991). L'expression "nucleotide" ou "base" designe non seulement un desoxyribonucleotide ou 
ribonucleotide naturel, mais tout nucleotide modifie comme il vient d'etre dit. 

Par promoteur, on entend toute sequence d'acide nucleique capable d'etre reconnue 
par une ARN polymerase pour initier la transcription, c'est-a-dire la synthese d'un ARN. Cette 
ARN polymerase peut etre soit ADN dependante, soit ARN dependante. 

Par promoteur naturel, on entend les sequences de promoteur, presentes dans le 
genome, codant pour TARN polymerase dont ce promoteur est specifique. Par sequence 
promotrice on entend la sequence d'un oligonucleotide qui entre dans la composition de Tun des 
brins du promoteur. 

Par transcription on entend la neosynthese de plusieurs brins d' ARN complementaires 
de la sequence (ou cible) se trouvant sous le controle du promoteur, le promoteur permettant 
l'initiation de cette reaction. Cette sequence se trouve en general contigue a Textremite 5' du brin 
matrice du promoteur. Les brins d'ARN synthetises sont appeles transcrits. 

Par transcription difFerentielle, on entend une transcription donnant des nombres 
difFerents de transcrits a partir de matrices differentes. 

Par mutation, on entend tout changement de sequence par rapport a la sequence 
naturelle. La mutation peut concemer les deux bases complementaires positionnees sur chaque 
brin d'un duplex d'acide nucleique, ou n'en concemer qu'une. Si la mutation concerne une seule 
des deux bases complementaires, elle donne lieu a l'apparition de ce qu'on appelle un 
mesappariement. 

Par mesappariement on entend introduction a l'interieur d'un double brin d'acide 
nucleique de paires de bases autre que A:T, C.G ou A:U. 

Par non-appariement on entend la presence de nucleotides qui ne sont pas appariees 
avec une base du brin d'acide nucleique complementaire, de par leur nature, ou de par leur 
position dans la sequence. Si plusieurs bases d'un meme brin sont non appariees, elles peuvent 
former des liaisons entre elles, qui peuvent provoquer l'apparition de structures secondares dites 
"boucles" ou "tiges-boucles". 

Par deletion, on entend Pelimination de certains nucleotides d'une sequence. Une 
deletion peut concemer une seule base, ou plusieurs bases contigues. Si plusieurs bases non 
contigues sont concemees, on parlera de deletions multiples. Sur un acide nucleique double brin, 
une deletion concerne en general a la fois les deux bases complementaires positionnees sur chaque 
brin d'acide nucleique. Cependant, une deletion peut aussi intervenir seulement sur une ou 
plusieurs bases d'un seul brin, et provoquer des non-appariements. 

Par sequence consensus, on entend une sequence nucleotidique theorique dans 
laquelle le nucleotide, a chaque site, est celui qui apparait le plus frequemment a ce site, dans les 
differentes formes naturelles de l'element genetique considere (par exemple le promoteur). Le 
termes "consensus" designe egalement toute sequence reelle trfa proche de la sequence consensus 
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theorique. 

On rappelle que la transcription s'effectue par synthese, dans le sens 5'->3\ (Tun ARN 
antiparallele et complementaire du brin nucleotidique transcrit (appele "brin matrice", ou encore 
"brin antisens"). Le brin d'ADN qui est complementaire du brin transcrit est appele "brin non- 
5 matrice" ou "brin sens". Par convention, le nucleotide a partir duquel la transcription commence 
est note +1 (ou simplement 1). Sur le brin matrice, les nucleotides successifs situes du cote de 
Textremite 3' (region amont) sont, a partir de +1, numerates -1,-2, etc. Une region aval, par 
rapport a un nucleotide donne (ou a une sequence donnee) est situee vers Textremite 5 f du brin 
matrice, et done vers l'extremite 3' du brin d'ARN synthetic. A partir de +1, les nucleotides en 
10 aval correspondent successivement aux positions +2, +3, etc. 

Le promoteur est une sequence nucleotidique contenant notamment un site de fixation 
pour TARN polymerase. Le promoteur est situe en amont par rapport au site de debut de 
transcription. 

Comparees aux ARN polymerases bacteriennes, eucaryotes, ou mitochondriales, les 
15 ARN polymerases phagiques sont des enzymes tres simples. Parmi celles-ci, les mieux connues 
sont les ARN polymerases des bacteriophages T7, T3 et SP6. L'ARN polymerase du 
bacteriophage T7 est donee (voir notamment le brevet US 4952496). Ces enzymes sont tres 
homologues entre elles et sont formees par une seule sous-unite de 98 a 100 kDa. Deux autres 
polymerases phagiques partagent ces homologies : celle du phage Kl 1 de Klebsielle et celle du 
20 phage BAH ; voir Diaz et al., J. Mol. Biol 222 : 805-81 1 (1993). 

Les promoteurs naturels specifiques des ARN polymerases des phages T7 t T3 et SP6 
sont bien connus. Le sequen^age du genome entier du bacteriophage T7 en 1983 par Dunn et al 
(J. Mol. Biol. 166, 477-535 (1983)) a permis de definir Texistence de 17 promoteurs sur cet ADN 
representes dans le tableau 1 ci-dessous (brin non-matrice). 
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10 



15 



20 



25 



30 



Tableau 1 

Promoteurs pour la T7 ARN polymerase 



Promoteur 



Nucleotide 



Sequence conservee 



-10 1 
TMTACXSACrCACTAIAQGGAGA 



Promoteur de replication 


-20 


-10 1 


0OL 


• 

TTGTCTTTAT 


• 

TMTACAACTCACTATAAGGAGA GA 


Promoteurs de classe II 


-20 


-10 1 


Ol-IA 


• 

MCGCCAMT 


• 

CMTACGACTCACrATAGAGGGA CA 


01-1B 


TTCTTCOGGT 


TMTACGACTCACTATAQGAGGA CC 


01-3 


GGACTGGAAG 


TMTACGACTCAGTATAGGGACA AT 


01-5 


AGTTAACTQG 


TAATACGACTCACTAAAQGAGGT AC 


01-6 


TQGTCACGCT 


TMTACGACTCACTAAAGGAGAC AC 


02-5 


AGCACCGMG 


TAATACGACTCACTATTAGGGAA GA 


03-8 


CGTGGATMT 


TAATTGAACTCACTATTAGGGAA GA 


04c 


CCGACTGAGA 


CAATCCGACTCACTAAAGAGAGA GA 


04-3 


AGTCCCATTC 


TAATACGACICACTAAAGGAGAG AC 


04-7 


TTCATGAATA 


CTATTCGACTCACTATAGGAGAT AT 


Promoteurs de classe III 


-20 


-10 1 


06-5 


GTCCCTAMT 


TMTAQGACTCACTATAGGGAGA TA 


09 


GCCGGGAATT 


TAATACX^ACTCACTATAGGGAGA CC 


010 


ACTTCGAAAT 


TMTACGACTCACTATAGGGAGA CC 


013 


GQCTCGAAAT 


TAATACGACTCACIATAGGGAGA AC 


017 


GCGTACCAM 


TMTACGACTCACTATAGGGAGA GG 


Promoteur de replication 


-20 


-10 1 


0OR 


CACGATAAAT 


TMTACGACTCACTATAGGGAGA GG 



Comme cela ressort du tableau ci-dessus, vingt trois nucleotides contigus situes entre 
les positions -17 et +6 par rapport au site d'initiation (position 1) de la transcription sont 

35 fortement conserves. Ces nucleotides sont meme identiques chez les 5 promoteurs de classe III, 
qui sont les plus efficaces in vivo et in vitro. Parmi les 1 1 promoteurs differents, la plupart 
divergent par les nucleotides compris entre les positions +3 a +6. Parmi les nucleotides compris 
entre les positions -16 et -1, neuf sont completement conserves, et quatre autres sont conserves 
dans 16 promoteurs. Ces constatations suggerent que ces 13 nucleotides sont des facteurs 

40 importants de la definition d'un promoteur. Ces conclusions ont ete confirmees par la mise en 
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evidence de Tefficacite d'un promoteur apres coupure de l'ADN en amont de la position -21 
(Osterman, H. L. et al. (1981) Biochemistry 20, 4884-4892) et -17 (Martin, C. T. et al. 51987) 
Biochemistry 26, 2690-2696). Par contre, ces memes publications montrent qu*une coupure en 
amont de -10 ou -12 abolit cette efficacite. 
5 L'ARN polymerase du phage T3 est presque aussi bien connue que la T7 ARN 

polymerase. Ces deux enzymes ont une structure tres similaire (80 % d'identite) (McGraw, N. J. 
et al.(1985) Nucleic Acids Res. 13, 6753-6766) mais possedent pourtant une specificite de matrice 
presque absolue. Les sequences de 1 1 promoteurs specifiques pour la T3 ARN polymerase ont ete 
determinees et sont presentees dans le tableau 2 ci-dessous (brin non-matrice). 

10 

Tableau 2 

Promoteurs pour la T3 ARN polymerase 



15 



20 



25 



30 



Promoteur 




Nucleotide 






-20 


-10 1 




Sequence conserved 




* • 

TATTAACCCTCACTAAAGQGAGA. 






-20 


-10 1 






GTC 


• * 

IATTTAOCCTCACTAAAGQGAAT 


AAGG 




TAG 


CATTAAOCCTCACTAACGGGAGA 


CTAC 




TAG 


AGTTAACOCIGACTAACGGGAGA 


GTTA 




AAG 


TAATAACCCTCACEAACAGGAGA 


ATOC 




GGG 


CATTAAOCCTCACTAACAG3^GA 


CACA 




GCC 


TMTTAOOCTCaCTAAAGGGAAC 


AAOC 




TAG 


AATTAACCCT3ACTAAAGGGAAG 


AGGG 




TCT 


AATTAACCCTCACTAAAQGGAGA 


GAOC 




ACC 


TMTTACCCTCACTAAAGGGAGA 


CCTC 




GTG 


AATTMCOCTCACTAAAGGGAGA 


CACT 




TTG 


CATTAACCCTCACTAAAQQGAGA 


GAGG 



Actuellement, 4 sequences differentes de promoteurs pour TARN polymerase du 
phage SP6 ont ete mises en evidence par Brown, J. E., et al. (Nucleic Acids Res. 14, 3521-3526 
35 (1986)). L'ARN polymerase du phage SP6 presente aussi beaucoup de similitudes avec TARN 
polymerase du phage T7. Ces sequences sont presentees au tableau 3 ci-dessous (brin non- 
matrice). 
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Tableau 3 

Promoteurs pour la SP6 ARN polymerase 



Promoteur Nucleotide 

5 40 1 

Sequence conservee ATTTAGGTGACACTAIA^^ 

-20 40 1 

0 pSP64 ACACATACG ATTTAGGTGACACTAIA^ AA 
pJEBl TMTTGCCT ATTTAGGIX^CAC^^ AG 

pJEB4 GGACTTGGT MTTAGG9GACACTATAGAAGGA GG 

pJEB6 GTGTCTCTT ATTTAGQGGACACTAIAGAAGAG AG 



15 

De meme que pour la T7 ARN polymerase, les sequences des promoteurs pour la T3 
ARN polymerase, et pour la SP6 ARN polymerase sont tres similaires, notamment entre les 
positions -17 et +6. La comparaison des sequences de ces trois promoteurs (Figure 1) montre sr 
l'existence d'une sequence commune de la position -7 a -3 ; voir a ce propos notamment : : 

20 BROWN, J.E. et al., Nucleic Acid Res., 14, 3521-3526 (1986), et Bailey et al., Proc. Natl. Acad. 
Sci. USASQ : 2814-2818 (1983). 

II est done possible de considerer que les diverses ARN polymerases phagiques 
etudiees ci-dessus font partie d'une famille d'ARN polymerases qui reconnaissent des promoteurs 
presentant une sequence consensus de la position -17 a la position +6, et notamment de -17 a -1. 

25 Pour obtenir TARN correspondant a une sequence d'ADN donnee sous Taction d'une 

ARN polymerase, il est necessaire de mettre cette sequence sous la dependance du promoteur de 
cette ARN polymerase. C'est I'etape dite d'installation d'un promoteur, juste en amont de la 
sequence a transcrire. Cette installation, dans Tetat actuel de Tart, necessite l'utilisation de 
methodes laborieuses. 

30 La methode la plus classique d'installation d'un promoteur est le clonage de la 

sequence a transcrire dans un vecteur contenant un promoteur pour une ARN polymerase 
phagique en amont d'un site de clonage. Plusieurs vecteurs de ce type sont commercialises, 
comme par exemple pT3/T7-LUC (Clontech Laboratories, Inc.), ou lambda ZAP II, Uni-ZAP 
XR, lambda DASH II, lambda FIX II, pWE 15 et superCos cosmid (Stratagene Cloning System), 

35 ou pT7-0, pT71, ou pT7-2 (United States Biochemical), ou encore pT7/T3a-18 ou pT7/T3a-19 
(GIBCO BRL) ou decrits dans des publications, comme les vecteurs pET (Rosenberg, A H. et al., 
Gene 5£, 125-135 (1987)). Cest apres obtention du fragment d'ADN a doner, insertion dans le 
vecteur et amplification du vecteur que la transcription peut etre effectuee. Cette methode permet 
de transcrire n'importe quelle sequence. Cependant elle est tres laborieuse, et ne permet pas 

40 d'obtenir n'importe quelle extremite sur TARN, car la localisation de cette derniere est imposee par 
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le site de restriction enzymatique utilise pour le clonage. 

Certaines methodes connues pour la synthese in vitro d'oligoribonucleotides 
necessitent la synthese par voie chimique de deux oligodesoxynucleotides complementaires 
comprenant un promoteur pour une ARN polymerase phagique. II a ete demontre (Milligan et al., 
5 article cite), qu'une matrice partiellement simple brin, qui est double brin uniquement sur la 
sequence promoteur, de la position +1 a -14, est aussi active en transcription qu'une matrice 
double brin. Ainsi, la methode necessite la synthase d'un nucleotide de 15 mer comprenant la 
sequence du brin non-matrice d'un promoteur phagique de la position -14 k +1, et d'un deuxieme 
oligonucleotide contenant a son extremite 3', la sequence complementaire du premier, et sur sa 

10 region 5', la sequence complementaire de l'oligoribonucleotide que Ton desire synthetiser. Comme 
la synthese chimique ne permet pas d'obtenir des oligonucleotides de bonne qualite si leur taille 
est superieure a 70 bases, cette technique n'est pas applicable pour Ies oligoribonucleotides de plus 
de 55 bases, si on utilise les sequences de promoteurs deja decrites. De plus la methode necessite 
de connaitre exactement la sequence de TARN que Ton veut synthetiser. 

15 Une autre methode d'installation d'un promoteur sur une sequence, par ligation, est 

possible (Leary, S. et al., Gene lflfi, 93-96, (1991)) si cette sequence poss&ie une extremite 3' 
bien definie. II s'agit de l'hybridation sur cette extremite 3' d'un oligonucleotide portant la sequence 
du brin non-matrice du promoteur, suivie par la sequence complementaire de l'extremite 3' de la 
sequence cible, sur une longueur suffisante pour permettre l'hybridation. Un deuxieme 

20 oligonucleotide intervient, dont la sequence est complementaire de la region promoteur du 

premier, et qui porte un groupement phosphate en 5*. L'hybridation des deux oligonucleotides et 
de la cible met en contact l'extremite 5' phosphate de l'oligonucleotide portant la sequence du brin 
matrice du promoteur, et l'extremite 3* OH de la cible. Sous Taction d'une ligase, la liaison 
phosphodiester entre ces deux extremites est etablie, permettant la formation d'un complexe dans 

25 lequel la cible se trouve sous le controle du promoteur. 

L'apparition de la technique de "reaction de polymerisation en chaine" (PCR), a 
permis la creation de nouvelles methodologies plus performantes pour 1'installation d'un 
promoteur. La matrice de transcription est synthetisee par PCR. L'amorce en amont apporte le 
promoteur pour TARN polymerase phagique et definit l'extremite 5 1 du produit de transcription 

30 (ou transcrit), alors que l'amorce en aval definit l'extremite 3* de 1'ADN amplifie et du transcrit. 
Cette technique permet d'obtenir un ARN de taille et d'extremite 3' quelconques. 

L'installation d'un promoteur phagique, grace a une reaction inspiree du cycle des 
retrovirus, est possible a partir d'un ARN (Kwoh, D. Y. et al., P.N.A.S. USA; 3£, 1 173-1 177, 
(1989)). Une amorce amont portant la sequence du promoteur sert a synthetiser 1'ADN 

35 complementaire de TARN grace a une transcriptase inverse. L'ARN du duplex ARN: ADN ainsi 
forme est digere par la RNase H. L'ADN simple brin ainsi libere s'hybride avec la deuxieme 
amorce qui, grace a la transcriptase inverse, permet la synthese du deuxieme brin d'ADN 
complementaire. Cependant cette premiere etape ne permet pas de definir l'extremite 3' de 1'ARN. 
C'est la deuxieme synthese par les memes enzymes et par le meme proced6, d'une deuxieme 

40 generation de matrice pour TARN phagique, a partir des premiers transcrits obtenus, qui permet 
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d'obtenir une extremite 3' strictement definie par la seconde amorce utilisee. 

L'un des buts de I'invention est de reduire au maximum les difficultes d'installation du 
promoteur, a l'aide de promoteurs modifies de sequence courte, permettant de reduire les 
contraintes de sequence sur la sequence cible a transcrire. L'invention permet aussi d'obtenir des 
5 promoteurs de differentes efficacites, utilisables pour la transcription a des taux differents de 
sequences differentes, dans un meme milieu reactionnel. 

lAitilisation des promoteurs modifies selon Pinvention permet d'obtenir la transcription 
d'une sequence quelconque d'acide nucleique, desoxyribonucleique ou ribonucleique. 

L'invention a done pour objet un oligonucleotide utilisable comme brin non-matrice de 
10 promoteur, dans la transcription d'une sequence d'une cible nucleotidique, en presence d'une ARN 
polymerase phagique ayant un promoteur naturel specifique, a partir d'un site de ladite cible qui 
n'est normalement pas un site d'initiation de la transcription pour ladite ARN polymerase 
phagique, laquelle est choisie parmi celles des phages dont les ARN polymerases ont des 
promoteurs specifiques comprenant une sequence consensus au moins depuis la position -17 
15 jusqu'a la position -1 , caracterise par le fait : 

- qu'il comprend une sequence de coeur flanquee a Tune au moins de ses extremites 
d'une sequence nucleotidique capable d'hybridation avec une sequence de la cible, 

- que ladite sequence de coeur est constituee par une sequence de 6 a 9 nucleotides 
consecutifs choisis dans la region -12 a -4 du brin non-matrice dudit promoteur specifique, ou une 

20 sequence suffisamment homologue permettant de conserver la fonctionnalite de ladite ARN 
polymerase, 

- qu'une sequence flanquante est complementaire d'une premiere region de la cible, et 
que l'autre sequence flanquante, lorsqu'elle est presente, est complementaires d'une seconde region 
de la cible, lesdites premiere et seconde regions etant separees, sur la cible, par une sequence 

25 ayant un nombre de nucleotides egal au nombre de nucleotides de la sequence de coeur, 

- et que le nombre de nucleotides de la region flanquante, ou la somme du nombre de 
nucleotides des regions flanquantes, est au moins suffisamment eleve pour que ledit 
oligonucleotide puisse s'hybrider avec la cible a la temperature d*utilisation de l'ARN polymerase. 

Les ARN polymerases phagiques presentant les caracteristiques indiques ci-dessus 
30 sont du type comportant une seule sous-unite et ayant une masse moleculaire voisine de 100 kDa. 
L'invention s'etend bien entendu a l'utilisation d'ARN polymerases virales, non phagiques, 
presentant des caracteristiques analogues, et a la modification des promoteurs specifiques desdites 
ARN polymerases virales. 

On a en effet decouvert qu'une sequence courte, telle que la sequence de coeur 
35 mentionnee ci-dessus, est capable de fonctionner comme promoteur de TARN polymerase. Cette 
decouverte presente un caractere surprenant dans la mesure ou la majeure partie de la sequence de 
coeur, telle que definie ci-dessus, correspond a des sequences tris variables des promoteurs 
sauvages, notamment entre les positions -8 et -12, comme le montre Texamen de la figure 1 
La sequence de coeur etant relativement courte, cela augmente les chances de 
40 rencontrer de fa?on aleatoire sur une sequence cible, une sequence complementaire de la sequence 
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de coeur, ou suffisamment complementaire de la sequence de coeur pour permettre l'hybridation 
au moins partielle avec celle-ci. II en resulte une possibilite d'effectuer une transcription en un site 
qui n'est normalement pas un site de debut de transcription, avec le promoteur sauvage, non 
modifie. Cette possibilite se trouve encore augmentee par la presence de la region flanquante ou 
5 des regions flanquantes, qui sont par construction complementaires de la cible et qui contribue de 
fa?on importante a l'hybridation du promoteur modifie sur la cible. 

De preference, la sequence de coeur est choisie parmi des sequences de 6 a 9 
nucleotides d'un promoteur naturel existant. Toutefois, des sequences homologues, differant par 
exemple d'un ou deux nucleotides par rapport au promoteur naturel, peuvent aussi etre utilisees, 

10 notamment pour ameliorer, le cas echeant, rappariement de la sequence de coeur avec la sequence 
correspondante de la cible, dans la mesure ou la sequence de coeur est sufiBsamment homologue 
de la sequence naturelle correspondante pour conserver la fonctionnalite de l'enzyme, c'est-a-dire 
dans la mesure ou l'enzyme peut fonctionner avec un promoteur ayant une sequence de coeur ainsi 
modifiee, ce qui peut etre facilement verifie par de simples experiences de routine. 

15 ^oligonucleotide de l'invention peut etre constitue de bases naturelles, 

desoxyribonucleiques ou ribonucleiques, ou etre constitue au moins en partie de bases modifiees. 
II peut etre constitue notamment ^oligonucleotides modifies par couplage avec du psoralene, ou 
encore etre constitutes de PNA (peptide nucleic acids). 

Lorsque deux sequences flanquantes sont presentes respectivement en amont et an 

20 aval de la sequence de coeur, elles sont complementaires de deux regions de la cible espacees, sur 
la cible, d'un nombre de nucleotides egal au nombre de nucleotides de la sequence de coeur. 

Grace a la region flanquante, ou aux regions flanquantes, l'hybridation de 
I'oligonucleotide avec la cible permet generalement d'effectuer la transcription, y compris dans le 
cas ou la sequence de coeur n'est pas complementaire, meme partiellement, de la region en regard 

25 sur la cible, dans le duplex cible-oligonucleotide. Cette possibilite est encore augmentee avec 
l'utilisation de bases modifiees pour la realisation de la sequence de coeur et/ou des sequences 
flanquantes. 

L'invention permet done d'effectuer la transcription d'une sequence quelconque d'une 
cible donnee, en faisant debuter la transcription en un site qui ne serait normalement pas un site 
30 d'initiation de la transcription pour un promoteur non modifie. 

Selon un mode de realisation prefere, I'oligonucleotide de l'invention comporte une 
region flanquante amont dont le nombre de nucleotides est tel que la somme des nombres de 
nucleotides de la sequence de coeur et de la sequence flanquante amont est au moins egale a 10, 
et en particulier au moins egale all. Chaque region flanquante comporte de preference au 
35 moins S nucleotides et en particulier de 5 a 12 nucleotides. 

La sequence -12 a -4, dans laquelle peut etre choisie la sequence de coeur, est en 
particulier Tune des sequences -12 a -4 du brin non matrice d'un promoteur sauvage. De telles 
sequences -12 a -4 sont par exemple les suivantes : 
- GGTGACACT 
40 - CGACTCACT 
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- ACCCTCACT 

- GGGCACACT 

- CGACTCACT 

- CAACTCACT 
5 - CGACTCAGT 

- GAACTCACT 

Comme indique precedemment, la sequence de coeur peut etre choisie a l'interieur des 
sequences -12 a -4 de promoteurs sauvages. II est aisement concevable que le rendement de la 
transcription pourra varier en fonction des sequences utilisees comme sequences de coeur. II est 

10 toutefois possible, par selection a l'aide de simples experiences de routine portant sur des essais 
de transcription, de construire un promoteur modifie permettant d'effectuer la transcription avec 
un rendement au moins egal a un seuil predetermine. 

Bien entendu, les oligonucleotides dont la sequence de coeur correspondrait a une 
sequence d'un promoteur naturel, et dont les sequences amont et aval seraient fortuitement 

15 presentes dans ledit promoteur naturel, ne font pas partie de 1'invention. 

L'invention a egalement pour objet un procede de preparation d'un oligonucleotide 
utilisable comme promoteur modifie pour ARN polymerase, caracterise par le fait que Ton 
synthetise, selon les methodes connues en soi, un oligonucleotide tel qu'il a ete defini ci-dessus. & 
La presente invention permet de mettre une sequence quelconque sous le controle : 

20 d'un tel promoteur modifie. Les methodes utilisees pour cela sont notamment les methodes deja 
connues en soi, et en particulier les suivantes : 

(1) le clonage de la sequence d'un tel promoteur en amont d'un site de clonage dans un 
vecteur d'expression plasmidique, permettant ensuite le clonage dans ce vecteur de la sequence 
que Ton desire transcrire sous le controle de ce promoteur. 

25 (2) la synthese d'un oligonucleotide comprenant la sequence du brin non matrice d'un 

promoteur modifie, et d'un deuxieme oligonucleotide contenant a son extremite 3' la sequence 
complementaire du premier, et a son extremite 5' la sequence complementaire de 
Poligoribonucleotide que Ton desire synthetiser. Comme la synthese chimique est limitee en ce qui 
concerne la taille maximum des oligonucleotides, l'utilisation de promoteurs de sequence plus 

30 courte permet de synthetiser des oligoribonucleotides plus longs que si on utilise les sequences 
naturelles de promoteurs. 

(3) la synthese d'une matrice de transcription par Reaction de Polymerisation en 
Chaine, 1'amorce en amont apportant le promoteur modifie et definissant l'extremite 5' du transcrit, 
l'amorce en aval definissant l'extremite 3* de 1'ADN amplifie et du transcrit. 

35 (4) la synthese d'une matrice de transcription par elongation, a 1'aide d'une 

transcriptase inverse, d'une amorce amont portant la sequence du promoteur modifie hybride sur 
un ARN, digestion par la RNAse H de TARN contenu dans le duplex ARN: ADN ainsi forme, et 
hybridation de l'ADN simple brin ainsi libere avec la deuxieme amorce qui, par elongation a l'aide 
de la transcriptase inverse, permet la synthese du deuxieme brin de la matrice et du promoteur 

40 modifie. 
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(5) Installation par ligation d'un promoteur modifie sur une sequence acide 
desoxyribonucleique ou un acide ribonucleique si cette sequence possede une extremite 3' bien 
definie, par hybridation sur cette extremite 3' d'un oligonucleotide portant la sequence du brin non 
matrice du promoteur modifie, suivie par la sequence complementaire de I'extremite 3* de la 
5 sequence cible, sur une longueur suffisante pour l'hybridation, et hybridation sur ce premier 
oligonucleotide d'un deuxieme oligonucleotide dont la sequence est complementaire de la region 
promoteur modifie du premier, et qui porte un groupement phosphate en 5\ L'hybridation des 
deux oligonucleotides et de la cible met en contact I'extremite 5' phosphate de l'oligonucleotide 
portant la sequence du brin matrice du promoteur et I'extremite 3' OH de la cible. L'action d'une 
10 ligase permet alors la formation d'un complexe ou la cible se trouve sous le controle du promoteur 
modifie. 

La presente invention concerne egalement 1'installation d'une sequence quelconque 
sous le controle d'un promoteur modifie, par une methode, decrite ci-apres, fondee sur l'utilisation 
de sequences double brin plus courtes que la sequence sauvage du promoteur, et/ou presentant 
15 des mesappariements amenes par des mutations sur le brin non codant, et/ou presentant des non 
appariements dus a une/des deletions sur le brin matrice du promoteur, et/ou portant d'autres 
modifications. En particulier, la presente invention concerne installation simplifiee d'un 
promoteur pour une ARN polymerase en amont d'un acide nucleique (appelee cible) de sequence 
donnee, de nature acide desoxyribonucleique ou acide ribonucleique, de fa?on a permettre la 
20 transcription de cette sequence par TARN polymerase concernee. 

La methode consiste a faire hybrider, sur la region 3' de la sequence a transcrire et sur 
la region immediatement adjacente en 3* de cette sequence, un oligonucleotide de sequence 
partiellement ou totalement complementaire de la cible, mais capable de s'hybrider avec la cible a 
la temperature d'utilisation de TARN polymerase. 
25 L'oligonucleotide s'hybride au moins partiellement avec la cible grace a l'hybridation 

sur la cible d'au moins la sequence flanquante (ou les sequences flanquantes). 

La region M de coeur" peut done presenter des non appariements ou des 
mesappariements avec la cible, e'est-a-dire des regions qui, de par leur sequence ou leur position 
ne sont pas en contact d'hybridation avec le brin matrice de la cible. En effet, l'hybridation de 
30 l'oligonucleotide, grace a la sequence flanquante, ou aux sequences flanquantes, sur les regions de 
la cible qui leur sont complementaires, permet la juxtaposition de la sequence M de coeur" avec une 
sequence eventuellement quelconque de la cible. 

L'invention concerne egalement l'utilisation du promoteur modifie ci-dessus, comme 
brin non matrice de promoteur dans la transcription d'une sequence d'une cible nucleotidique 
35 capable de s'hybrider avec ledit oligonucleotide. 

Pour la mise en oeuvre de cette utilisation, il convient de mettre en contact 
l'oligonucleotide avec la cible dans des conditions permettant la transcription, ce qui peut 
s'effectuer de differentes fa?ons, et notamment comme suit : 

(1) Si 1'acide nucleique cible est un simple brin, Thybridation peut etre effectuee par 
40 melange de la cible avec l'oligonucleotide, en solution dans un tampon qui est preferentiellement le 
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tampon dans lequel s'effectuera la reaction de transcription, a une temperature permettant 
1'hybridation. 

(2) Si l'acide nucleique cible est un double brin, 1'hybridation peut etre effectuee 
comme suit : 

(2. 1) Si l'oligonucleotide est un oligonucleotide non modifie, la cible devra etre 
denaturee, avant d'etre hybridee a l'oligonucleotide dans les conditions decrites au paragraphe (1). 
La denaturation peut etre effectuee selon des procedes connus, en particulier par la chaleur 
(incubation durant 5 minutes a 95°C), ou encore par traitement alcalin (NaOH 0,1M durant 5 
minutes), suivi de neutralisation avant hybridation avec ^oligonucleotide. 

(2.2) Si Toligonucleotide est un oligonucleotide modifie, et en particulier un PNA, 
Thybridation ne necessite pas de denaturation prealable de la cible. Les sequences constitutes en 
tout ou partie de PNA sont en effet capables de deplacer le brin complementaire du brin sur lequel 
elles peuvent s'hybrider ; voir Nielsen, P.E. et al., Science 254, 1497-1500 (1991). 

La transcription proprement dite est effectuee dans les conditions usuelles, qui sont 
bien connues, en presence de TARN polymerase appropriee et de ribonucleosides triphosphates, 
et qui ne seront pas rappelees ici. 

La presente invention permet aussi d'effectuer une transcription differentielle de deux 
sequences differentes dans un meme milieu reactionnel contenant une ARN polymerase 
reconnaissant le promoteur modifie. Parmi les promoteurs modifies selon invention, certains 
permettent d'obtenir un taux de transcription egal a celui obtenu par utilisation d'un promoteur 
sauvage, et d'autres permettent au contraire d'obtenir un taux de transcription plus faible. La 
transcription differentielle a des utilisations multiples. En particulier elle permet : 

(1) la transcription des brins codants et non codants d'une matrice qui porte a chaque 
extremite ou sur une seule extremite un promoteur modifie. L'introduction d'une difference dans 
I'efficacite des deux promoteurs permet de plus d'obtenir une synthese en quantite plus importante 
d'un brin vis a vis de l'autre, si initialement, les deux brins ont la meme capacite de transcription 
avec le meme promoteur. Dans le cas ou, au contraire, les deux brins n'ont pas la meme efficacite 
de transcription avec un meme promoteur, le choix de deux promoteurs a efficacite differente 
permet d'equilibrer le taux de transcription des deux transcrits. 

(2) Texpression simultanee de proteines ou polypeptides que Ton veut obtenir dans 
certaines proportions au sein du milieu reactionnel, comme par exemple deux sous unites a et b 
d'une meme holoenzyme a2b. Pour cela, la sequence de la sous-unite a est mise sous le controle 
d'un promoteur sauvage, la sequence b est mise sous le controle d'un promoteur modifie dont 
Tefficacite est deux fois moindre par rapport a celle du promoteur de type sauvage. 

Dans les dessins annexes : 

La figure 1 est un tableau comparatif des sequences consensus des promoteurs pour 
les T3, T7 et SP6 ARN polymerases. 

La figure 2 represente la sequence consensus (double brin) du promoteur de TARN 
polymerase T7 entre les positions -17 et +1. On a represente le produit normal de la transcription. 
Le site de demarrage de transcription est indique par le symbole +1 . Les zones encadrees 
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definissent les sites sur lesquels ont ete realisees les deletions, sur le brin non-matrice (brin 
superieur) et/ou sur le brin matrice (inferieur), conformement a Texemple 1. 

La figure 3 decrit Tensemble des combinaisons de structures promotrices etudiees par 
transcription a Taide de TARN polymerase T7. Les barres grisees schematisent les structures 
5 oligonucleotidiques utilisees. Pour chaque hybride, la barre superieure correspond a une sequence 
decrite (de gauche a droite) de 5' vers 3' et la barre inferieure a une sequence decrite de 3' vers 5\ 
Les regions hachurees represented les sites amputes sur Tun ou Tautre des brins, conformement a 
la figure 2. Le taux de protection des produits de transcription relatifs a une taille donnee, 
visualises par autoradiographic, est indique selon le mode suivant : (-), absence de produit de 
10 transcription ; (*) : taux tres faible (**) : taux faible ;(***): taux moyen ;(****): taux eleve ; 
(+****) ; taux tres eleve. Les signaux encadres par des rectangles correspondent aux produits de 
transcription de taille attendue par rapport au site d'initiation presume et les signaux encercles 
correspondent a un produit de transcription de taille identique au brin non-matrice (superieur) des 
hybrides etudies. 

15 La partie A de la figure 4 decrit des combinaisons de sequences promotrices etudiees 

par transcription a l'aide d'ARN polymerase T7. Les barres grisees schematisent les structures 
oligonucleotidiques utilisees. Pour chaque hybride, la barre superieure correspond a une sequence 
decrite (de gauche a droite) de 5' vers 3* et la barre inferieure a une sequence decrite de 3* vers 5\ ^ 
Les regions hachurees represented les sites amputes sur Tun ou Tautre des brins, conformement a * 

20 la figure 2. Le taux d'obtention des produits de transcription relatifs a une taille donnee, visualises 
par autoradiographic, est indique comme a la figure 3. La partie B de la figure 4 repr&ente 
Tautoradiographie obtenue a Tissue des experiences schematises a la figure 4 A. Les signaux de 
transcription specifiquement attendus sont indiques par des fleches (a : 26 nucleotides; b : 29 
nucleotides), conformement a la partie A. Les chiffres au dessus de chaque piste indiquent la 

25 quantite d'ADN exogene utilisee dans Tessai considere. Les tailles des marqueurs de poids 
moleculaire (PM) sont indiquees sur la partie droite de Tautoradiogramme. 

La partie A de la figure 5 decrit des combinaisons de sequences promotrices etudiees 
par transcription a l'aide de TARN polymerase T7, avec les memes conventions que pour la 
figure 4. La partie B reprfaente Tautoradiographie obtenue a Tissue des experiences schematises 

30 a la figure 5 A. Les signaux de transcription specifiquement attendus sont indiques par des fleches 
(a : 26 nucleotides; b : 29 nucleotides; c : 50 nucleotides, d : 53 nucleotides, e : 58 nucleotides), 
conformement a la partie A. 

La figure 6 decrit schematiquement le fonctionnement d'un promoteur modifie selon 
Tinvention, avec Installation d'une sequence promotrice modifiee (brin non-matrice ; en trait gras) 

35 sur un site quelconque d*une sequence cible afin de definir un site d'initiation specifique de la 
transcription. La sequence representee en trait gras est maintenue sur la sequence cible par 
Thybridation de sequences flanquantes complementaires de la sequence cible. La region 
promotrice, sur laquelle TARN polymerase se fixe, est materialisee par un rectangle grise. Les 
ARN obtenus par transcription en presence de ribonucleotides triphosphates (rNTPs) sont 

40 schematises par des lignes ondulees. Le site de demarrage de transcription est figure par un rond 
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noir. 

La partie A de la figure 7 represente une structure promotrice modifiee creee par 
hybridation d'un oligonucleotide sur la sequence du genome de HTV (genepo/). Cet 
oligonucleotide est compose de deux parties flanquantes complementaires de la cible et d'une 

5 sequence identique au consensus du promoteur de I'ARN polymerase du phage T7 (17 bases). Les 
identites de sequences sont materialisees par des batonnets (I) et la partie en caractere gras sur 
fond grise represente la structure partiellement double brin correspondant a une structure 
"hemipromotrice". La partie B de la figure 7 represente une structure promotrice modifiee cree 
par hybridation d'un oligonucleotide sur la sequence du genome de HIV (gene gag). Cet 

10 oligonucleotide est compose de deux parties flanquantes complementaires de la cible et d'une 

sequence identique au consensus du promoteur de l'ARN polymerase du phage T7 (17 bases). Us 
identites de sequences sont materialisees par des batonnets (I) et la partie en caractere gras sur 
fond grise represente la structure partiellement double brin correspondant a une structure 
"hemipromotrice". Les ARN transcrits en presence d'ARN polymerase T7 et de ribonucleotides 

15 (rNTPs) sont indiques. Des points de suspension symbolisent une extremite d'un acide nucleique 
qui peut ne pas etre d'une longueur definie. 

Les exemples suivants illustrent Pinvention. 



20 EXEMPLE 1 : ANALYSE DE LA FONCTIONNALITE 

DE PROMOTEURS MODIFIES 

Differentes structures de promoteurs d'ARN polymerases phagiques (ADN - 
dependantes), et plus particulierement du phage T7 ont ete etudiees. Ces structures sont obtenues 

25 par 1'association de differentes sequences oligodesoxynucleotidiques synthetisees par voie 
chimique avec I'appareil Applied Biosystems 394 DNA/RNA Synthesizer. La liste de ces 
sequences (SEQ ID No: 1 a SEQ ID No:8) est indiquee en annexe. 

La preparation des matrices ADN etudiees a ete realisee a partir de solutions 
contenant 2,5 x lO* 4 copies d'oligodesoxynucleotides (ODN). Les differentes sotutions 

30 necessaires a la construction de la matrice sont associees dans un tube de microcentrifugeuse puis 
sechees sous vide. L'ensemble est repris dans 10 ul de tampon Tris-HCl 50 mM (pH 7.5) et remis 
en suspension. L'hybridation des structures possedant une complementarite de sequence meme 
partielle est realisee par denaturation a 95°C pendant 5 minutes, centrifugation (14000 x g, 10 
secondes), puis descente a temperature ambiante pendant 10 minutes. A ce stade, les matrices 

35 peuvent etre utilisees ou stockees a -20°C. Us essais de transcription sont realises a partir de 2 ul 
d'une dilution au l/10 eme des solutions precedentes, soit 5 x 10 12 copies de matrice simple ou 
double brin. 

Les reactions de transcription sont realisees dans le tampon suivant : Tris-HCl 40 mM 
(pH 8,1), spermidine 1 mM, dithiothreitol (DTT) 5 mM, Triton X-100 0,01 %, polyethyleneglycol 
40 (PEG, poids moleculaire 4000) 80 mg/ml, albumine de serum bovin (BSA) 50 ug (Boehringer). 
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Le volume reactionnel final est de 20 \xl et contient ATP, CTP, GTP, UTP (4 mM chaque), 5 *iCi 
de [a- 32 P]UTP, MgCl2 20 mM, 5 Unites d'ARN polymerase T7 (New England Biolabs) 
et 12 Unites de RNA Guard (Pharmacia). L'incubation est realisee a 37°C pendant 2 heures. 

Une fraction de 5 nl du melange reactionnel est prelevee et melangee avec 5 \xl de la 
solution suivante : formamide 98 %, Xylene Cyanol 0,083 %, Bleu de Bromophenol 0,083 %, 
EDTA 10 mM pH 5,0. Les echantillons sont chauffes a 65°C pendant 5 minutes puis refroidis 
rapidement sur de la glace. lis sont analyses par electrophorese (2 heures, 150 Volts) en gel de 
polyacrylamide 12-15 %, uree 7 M Les gels sont ensuite traites pendant 20 minutes dans une 
solution decide acetique/methanol (10/20, %/%), seches sous vide et autoradiographies pendant 
12heuresa-80°C. 

Les differentes combinaisons etudiees permettent de determiner Tinfluence de 
deletions situees dans les regions amont (AM) et aval (AV) de la sequence consensus du 
promoteur de TARN polymerase du phage T7, sur Tefficacite de transcription d*une matrice ADN 
definie. Les combinaisons permettent egalement de determiner Tinfluence respective de chacune 
de ces deletions selon qu'elles sont situees sur le brin non-matrice ou matrice du promoteur 
double brin (figure 2). Les diverses associations etudiees dans cet exemple sont schematiquement 
representees a la figure 3. 

L'analyse comparative des resultats issus des combinaisons E + /E", E + /AM-, AMT*7E" 
et AM + /AM" (figure 3) permet de determiner Tinfluence des deletions en amont du coeur (-4 a 
-12) du promoteur. EUe montre dans ce cas qu\ine deletion sur le brin non-matrice a, seule, peu 
d'effet mais qu'une deletion sur le brin matrice, seule, reduit 1'activite du promoteur. Cependant, 
une double deletion (brin non-matrice et matrice) retablit un niveau de transcription normal, ce qui 
montre que la partie amont du promoteur peut etre substitute par une sequence double brin 
quelconque sans modification de Tactivite de ce dernier. Le promoteur de TARN polymerase du 
phage T7 peut done etre modifie en amont de la position -12 sans incidence sur le rendement de 
transcription, ni modification du site d'initiation de celle-ci. 

L'analyse comparative des resultats issus des combinaisons E + /E", E+/AV", AV^VE" 
et AV+/AV- (figure 3) permet de determiner Tinfluence des deletions en aval du coeur (positions 
-4 a 12) du promoteur. La deletion du promoteur en aval induit un decalage du site d'initiation de 
transcription par rapport au site du promoteur sauvage (C, correspondant a la position +1). En 
effet, un transcrit de plus petite taille (26 au lieu de 29 nucleotides) est observe dans tous les cas 
oil un promoteur comprend une deletion aval sur le brin matrice. Cela demontre que le 
positionnement de TARN polymerase T7 sur le coeur du promoteur impose la localisation du site 
de demarrage de transcription sur le brin matrice. La partie aval du promoteur (-1 a -3) peut done 
etre enlevee et remplacee par une sequence differente de celle definie dans le consensus global 
de 17 paires de bases, ce qui demontre qu'un promoteur ainsi modifie conserve sa fonctionnalite, 
meme si le rendement de la reaction est legerement moindre. 

L'analyse comparative des resultats issus des combinaisons E^/E", E + /AM*. E + /AV" 
et E + /AA" (figure 3) permet de determiner Tinfluence des deletions par rapport a leur localisation 
respective sur le brin matrice du promoteur. Une deletion situee en amont ne modifie pas la taille 
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du transcrit, mais attenue legerement l'efficacite de transcription par rapport au promoteur 
sauvage. En revanche, une deletion situee en aval conduit a Tobtention d f un produit de 
transcription de taille plus courte (deplacement du site de debut de transcription) et affecte 
l'efficacite de transcription de plus de 50 %. La double deletion (amont et aval) produit un 
5 transcrit plus court mais son efficacite de transcription est similaire a celle correspondant a la 
deletion situe en aval. En d'autres termes, il n'y a pas d'effet cumulatif des deux types de deletion. 

L'analyse comparative des resultats issus des combinaisons E+/E", AM + /E", AV+TE* 
et AA+/E" (figure 3) permet de determiner Tinfluence des deletions sur le brin non-matrice du 
promoteur. Une deletion situee en amont ne modifie pas l'efficacite de transcription par rapport au 
10 promoteur sauvage. En revanche, une deletion situee en aval reduit de plus de 50 % l'efficacite de 
transcription. L'effet des deux mutations n'est pas cumulatif puisqu'une double deletion (amont et 
aval) permet d'obtenir une transcription presque aussi forte que le temoin. 

L'analyse comparative des resultats issus des combinaisons E + /E", AM+/AV', 
AM+/AA\ AA+/AV-, AV*7AM", AA + /AM', AV+/AA", AM 4 "/ AM", AV+/AV- et AA + /AA" 
15 (figure 3) permet d'etudier la fonctionnalite de structures promotrices possedant au moins une 
deletion sur chaque brin (non-matrice et matrice). Elle permet de constater qu'un promoteur 
homoduplex depourvu de sa partie amont (sur les deux brins) f ainsi qu'un promoteur depourvu de 
sa partie aval (sur les deux brins) conservent une bonne fonctionnalite par rapport au promoteur 
sauvage. De meme, tout promoteur depourvu de sa partie aval sur le brin matrice (mais non 
20 depourvu sur le brin non-matrice) est fonctionnel. Cela demontre qu'il est possible de definir un 
promoteur modifie d'ARN polymerase phagique a partir d'une sequence minimum presente sur un 
ADN cible. Enfin, meme si l'efficacite d'un promoteur homoduplex doublement ampute (en amont 
et en aval sur les deux brins) est reduite par rapport au promoteur sauvage, il faut constater que 
ce type de structure minimum permet neanmoins d'obtenir des transcrits avec une efficacite non 
25 negligeable. 

Dans des conditions analogues, il est possible de montrer que le brin matrice du 
promoteur permet, sous forme de simple brin, d'obtenir un transcrit de taille identique a celui 
obtenu a Taide d f un promoteur double brin. Une sequence simple brin matrice d'un promoteur 
possede done Tinformation necessaire a la fixation de TARN polymerase du phage T7 et a 

30 1'initiation de la transcription. 

En resume, les promoteurs bicatenaires raccourcis homo- ou hetero-duplex 
conservent une grande fonctionnalite par rapport au promoteur sauvage. En particulier, une 
deletion sur les deux brins en amont n'a pas d'influence sur le rendement de transcription. Une 
deletion en aval sur le brin matrice affecte peu le rendement de transcription mais modifie 

35 simplement la taille du transcrit par decalage du site d'initiation de transcription sur la matrice. La 
conservation de la partie aval sur le brin non-matrice seul du promoteur (localisation -3 a -1), au 
niveau de la sequence ^TATA 3 ', permet de conserver une efficacite de transcription proche de 
celle obtenue a Taide du promoteur sauvage. Neanmoins, il apparait clairement d'apres ces 
donnees qu'il est possible d'obtenir des promoteurs modifies de plus petite taille permettant 

40 d'initier la transcription a partir d'un site donne. 
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EXEMPLE 2 

ANALYSE QUALITATIVE DE LA SPECIFICITE DE TRANSCRIPTION A PARTIR DE 

PROMOTEURS MODIFIES 

5 Conformement a l'exemple 1 , la specificite de transcription in vitro de promoteurs 

modifies a ete etudiee en presence d'ADN exogene de sperme de saumon a differentes 
concentrations par essai. Les associations E + /E", AM"*7AM", AM+/AA* et AA + /AA" ont ete 
etudiees en presence de 0, 10, 100 et 1000 ng d'ADN exogene (figure 4). Cette etude permet de 
demontrer, sur quelques cas particuliers choisis dans 1'exemple 1, que la transcription effectuee in 

10 vitro est intrinsequement liee a la presence d'une structure promotrice fonctionnelle et non a la 
presence d'une sequence d'ADN aleatoire disponible pour 1'ARN polymerase T7. Les essais 
experimentaux ont ete realises de maniere identique a ceux de l'exemple 1 . 

La presence d'ADN exogene en forte concentration (1000 ng/essai) conduit a un fort 
bruit de fond correspondant a des transcrits aspecifiques de grande taille (figure 4B). Neanmoins, 

15 l'efficacite de transcription de la cible specifique n'est pas modifiee quantitativement, en presence 
ou en absence d'ADN exogene. Cela demontre que les structures promotrices etudiees permettent 
une fixation preferentielle et efficace de TARN polymerase T7, conduisant a la transcription 
specifique d'une cible pourvue d'un promoteur. Cette observation s'accorde avec le fait que 
Tintensite du bruit de fond aspecifique est inversement proportionnelle a l'efficacite du promoteur 

20 en presence, c'est-a-dire Tintensite relative du produit de taille attendue. Ces elements demontrent 
done la fonctionnalite des promoteurs modifies qui permettent une transcription specifique d'une 
cible situee en aval. 
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ANALYSE QUALITATIVE DES ARNs TRANSCRITS A PARTIR D f UNE SEQUENCE 
CIBLE CONTROLEE PAR UN PROMOTEUR MODDTE 

L'analyse qualitative de l'efficacite relative de difFerents types de structures 
30 promotrices a ete completee par une detection specifique des ARNs transcrits correspondant a la 
sequence situee en aval de la structure promotrice. Pour ce faire, des essais transcriptionnels ont 
ete realises conformement a l'exemple 1, a l'exception de toute incorporation de nucleotides 
modifies. Les associations E+/E", AM+,AM~, AM+VAA', AA + /AA", E + , AM + , AA + , E\ AM*, 
et AA" ont ete etudiees. Suite a la reaction de transcription proprement dite en absence d'isotope, 
35 les echantillons sont charges sur un gel d'electrophor&e. Apres migration selon les conditions de 
Texemple 1, les acides nucleiques sont transferes electriquement sur membrane de nylon (Hybond 
N, Amersham) a l'aide d'un appareil (Biorad) dans un tampon TBE x 0,5 pendant deux heures 
a 80 Volts. Les membranes sont sechees pendant 10 minutes a 80 °C puis les acides nucleiques 
sont fixes sur la membrane par irradiation UV a l'aide d'un appareil Stratalinker (Stratagene). Les 
40 membranes sont prehybridees a 42°C dans une solution de prehybridation. L'hybridation est 
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realisee avec une sonde oligonucleotidique (SEQ ID NO. 9) marquee radioactivement a son 
extremite 3' par du [a- 32 PJddATP en presence de terminate transferase et purifiee. L'hybridation 
est realisee pendant 12 heures dans des conditions discriminantes ("stringentes") ne permettant 
pas d'hybridations aspecifiques et les lavages sont egalement realises de maniere stringente. La 
5 membrane est ensuite enveloppee dans un film de cellophane et autoradiographies pendant 24 
heures a -80°C. Les resultats obtenus sont presented dans la figure 5. lis indiquent clairement 
qu'un promoteur double brin raccourci en amont (ANT^/AM") est aussi efficace qu\in promoteur 
sauvage (E + /E')- De meme, un promoteur raccourci en amont sur le brin non-matrice et en amont 
et aval sur le brin matrice (AM+/AA*) permet d'obtenir un transcrit specifique, c'est-a-dire 
10 complementaire de la sonde de detection de l'ARN cible. Le rendement d'obtention de ce transcrit 
est similaire a celui obtenu a l'aide du promoteur sauvage, ce qui confirme I'efficacite de ce 
promoteur modifie pour la transcription d'un ARN complementaire de la matrice situee en aval de 
ce celui-ci. L'ARN produit dans ces conditions possede une taille reduite de 3 nucleotides par 
rapport a l'ARN issu du promoteur sauvage. Ceci provient du decalage du site de demarrage de 
15 transcription sur le brin matrice, du a la deletion aval sur ce dernier. Ce decalage ampute 

vraisemblablement des trois premieres bases l'ARN transcrit, mais ne modifie pas la sequence 
situee en aval puisqu'un signal d'hybridation de meme intensite que dans le cas du promoteur 
sauvage est obtenu avec la sonde specifique du transcrit attendu. Un transcrit de taille reduite de 
3 nucleotides est egalement obtenu a partir du promoteur double brin ampute en amont et en aval 
20 (AA + /AA"). Comme attendu, les brins correspondant au brin non matrice du promoteur (E + , 
AM + , AA + ) ne permettent pas d'obtenir de transcrits specifiques. En revanche, avec le brin 
matrice seul, sauvage ou ampute en amont (E* et AM", respectivement), on obtient un transcrit 
specifique de taille attendue (29 nucleotides). Cela demontre pour la premiere fois la capacite de 
brins matrices des promoteurs phagiques a initier une transcription a un site precis. Un brin 
25 matrice de promoteur doublement ampute (AA") ne permet pas d'initier la transcription, ce qui 
montre ('importance de la sequence 5 'TAT 3 ' situee dans la partie aval du consensus du 
promoteur T7. La capacite de transcription peut etre retablie par hybridation en trans d'un brin 
non-matrice du promoteur comportant au moins cette sequence aval du promoteur. II est 
important de noter que ces promoteurs simple brin (brin matrice) conduisent tous a des initiations 
30 de transcription a d'autres sites que ceux defini par le positionnement de l'ARN polymerase sur 
son promoteur sauvage. Notamment, des transcrits comportant la sequence de l'ARN attendu, 
mais de longueur egale a celle du brin matrice, sont obtenus. Cela resulte de l'initiation d'une 
transcription a partir de l'extremite 3' libre d'un oligonucleotide, comme prec&iemment demontre ; 
voir Schenborn, E T. et Mierendorf, R.C. Jr., Nucleic Acid Research, 11, 6223-6236 (1985). 
35 En conclusion, il s'avere que des promoteurs phagiques amputes en amont ou en aval 

de leur consensus, simple brin ou double brin, sont capables d'induire specifiquement la 
transcription a un site particulier. 

Ainsi, conformement a l'invention, et comme le montre la partie experimentale ci- 
dessus, il est possible de creer des structures de promoteurs phagiques modifies ou partiellement 
40 conserves. Ces structures peuvent etre realisees notamment par hybridation d'un oligonucleotide 
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compose successivement (de 5' vers 3') d'une region complementaire de la cible simple brin 
(region flanquante), d'une sequence du brin non-matrice promoteur de l'ARN polymerase 
phagique, et eventuellement d'une seconde region flanquante complementaire de la cible 
(figure 6). Un tel oligonucleotide peut jouer le role d'hemipromoteur (brin non-matrice de 
promoteur) pour la transcription a l'aide d'ARN polymerase. Selon la nature de la sequence cible 
en regard de a la sequence du promoteur (dans le duplex cible-promoteur), et afin de limiter I'effet 
des mesappariemments de cette region sur la capacite de fixation de l'ARN polymerase, des bases 
modifiees (inosine, par exemple) peuvent etre introduites dans des positions particulieres de la 
sequence du promoteur. Ces modifications doivent etre adaptees a chaque cas particulier de 
sequence cible afin de favoriser la fixation de l'ARN polymerase sur la structure 
"hemipromoteur". La notion d'hemipromoteur'' recouvre l'idee d'une reconnaissance d'une 
sequence promotrice imparfaitement appariee. L'ARN polymerase se fixe sur la structure 
hemipromoteur et realise la transcription d'ARNs dont rextremite 5' (generalement un G) 
correspond a la premiere base situe en aval de la structure hemipromoteur (figure 6). Tout mode 
d'installation de ce type de structure "hemipromotrice", ainsi que l'utilisation d'une telle structure, 
font partie de 1'invention. 

L'etape eventuelle de denaturation initiale d'un acide nucleique double brin a 
transcrire peut etre effectuee de maniere thermique, chimique ou enzymatique. 

II est aise de trouver, au sein d'une sequence cible, des regions ayant une homologie 
suffisante avec la sequence consensus d'un promoteur d'ARN polymerase phagique, et a plus forte 
raison avec une sequence raccourcie, suffisante pour initier la transcription, comme montre ci- 
dessus, afin de creer une structure "hemipromotrice" par hybridation sur un brin cible d'une 
sequence promotrice de coeur flanquee d'au moins une sequence specifique de la cible. Le 
genome du virus d'immunodeficience humaine (HIV) presente par exemple deux regions 
d'homologie significative avec la sequence consensus du promoteur de l'ARN polymerase du 
phage T7 (5'TAATACGACTCACTATAG 3 '). Ces sequences sont 
5'gGCAACGACCCCTCGTCa3' et 5'TAATACGACTCACAATAT 3 ', et se situent 
respectivement a l'interieur des genes gag et pol. Les bases en caractere gras sont identiques dans 
la sequence consensus du promoteur et dans les sequences determinees par recherche 
d'alignements optimaux entre ledit consensus et la sequence totale du genome du HIV. 
L'hybridation d'une sequence contenant une partie de la sequence consensus (brin non-matrice) du 
promoteur de l'ARN polymerase du phage T7, flanquee de sequences complementaires de la cible 
HIV, permet d'installer une structure "hemipromotrice" sur le genome du HTV et de realiser, en 
presence d'ARN polymerase T7 et de ribonucleosides triphosphates (rNTPs) une transcription 
specifique a partie du site ainsi defini (figure 7). Cet exemple illustre par consequent la possibility 
d'application de cette methode d'initiation de transcription, a partir d'une sequence d'acide 
nucleique d'interet, potentiellement a tous les systemes biologiques existants. 
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LISTE DES SEQUENCES 



SEQ ID N° : 1 : 

5 GATCGTACCA TGTAATACGA CTCACTATAG ATCGTACCAT G 



SEQ ED N° : 2 : 

ATAACACTGC GGCCAACCAT GGTACGATCT ATAGTGAGTC 
GTATTACATG GTACGATC 

SEQ ID N° : 3 : 

ATAACACTGC GGCCAACCAT GGTACGATCT ATAGTGAGTC 
GCATGGTACG ATC 



15 SEQ ED N° : 4 : 

ATAACACTGC GGCCAACCAT GGTACGATCA GTGAGTCGTA 
TTACATGGTA CGATC 

SEQ ED N°: 5 : 

20 ATAACACTGC GGCCAACCAT GGTACGATCA GTGAGTCGCA 
TGGTACGATC 



SEQ ED N° : 6 : 

GATCGTACCA TGCGACTCAC TATAGATCGT ACCATG 36 

25 

SEQ ED N° : 7 : 

GATCGTACCA TGTAATACGA CTCACTGATC GTACCATG 38 
SEQ ED N° : 8 : 

30 GATCGTACCA TGCGACTCAC TGATCGTACC ATG 33 



SEQ ED N° : 9 : 
ATAACACTGCGGCCAAC 



17 



21 

REVINDICATIONS 
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1. Oligonucleotide utilisable comme brin non-matrice de promoteur, dans la 
transcription d'une sequence d'une cible nucleotidique, en presence d'une ARN polymerase 
phagique ayant un promoteur naturel specifique, a partir d'un site de ladite cible qui n'est 
normalement pas un site d'initiation de la transcription pour ladite ARN polymerase phagique, 
laquelle est choisie parmi celles des phages dont les ARN polymerases ont des promoteurs 
specifiques comprenant une sequence consensus au moins depuis la position -17 jusqu'a la 
position -1, caracterise par le fait : 

- qu'il comprend une sequence de coeur flanquee a l'une au moins de ses extremites 
d'une sequence nucleotidique capable d'hybridation avec une sequence de la cible, 

- que ladite sequence de coeur est constitute par une sequence de 6 a 9 nucleotides 
consecutifs choisis dans la region -12 a -4 du brin non-matrice dudit promoteur specifique, ou une 
sequence suffisamment homologue permettant de conserver la fonctionnalite de ladite ARN 
polymerase, 

- qu'une sequence flanquante est complementaire d'une premiere region de la cible, et 
que l'autre sequence flanquante, lorsqu'elle est presente, est complementaires d'une seconde 
region de la cible, lesdites premiere et seconde regions etant separees, sur la cible, par une 
sequence ayant un nombre de nucleotides egal au nombre de nucleotides de la sequence de coeur, 

- et que le nombre de nucleotides de la region flanquante, ou la somme du nombre de 
nucleotides des regions flanquantes, est au moins suffisamment eleve pour que ledit 
oligonucleotide puisse s'hybrider avec la cible a la temperature d'utilisation de 1' ARN polymerase. 

2. Oligonucleotide selon la revendication 1, caracterise par le fait qu'il comporte une 
region flanquante amont dont le nombre de nucleotides est tel que la somme des nombres de 
nucleotides de la sequence de coeur et de la sequence flanquante amont est au moins egale a 10, 
et en particulier au moins egale all. 

3 Oligonucleotide selon la revendication 1 ou 2, caracterise par le fait que les regions 
flanquantes component chacune de 5 a 12 nucleotides. 

4. Oligonucleotide selon l'une quelconque des revendications precedentes, caracterise 
par le fait que la sequence -12 a -4 dudit brin non matrice dudit promoteur est choisie parmi l'une 
des sequences suivantes : 

- ACCCTCACT 
- GGTGACACT 

- CGACTCACT 
- ACCCTCACT 
- GGGCACACT 
- CGACTCACT 
- CAACTCACT 

- CGACTCAGT 

- GAACTCACT 
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5. Procede de preparation ^oligonucleotides utilisables comme brins non-matrice dans 
la transcription d'une sequence d'une cible nucleotidique, a partir d'un site qui n'est normalement 
pas un site d'initiation de la transcription pour tadite ARN polymerase phagique, caracterise par le 
fait que Ton synthetise des oligonucleotides tels que definis dans l'une quelconque des 

5 revendications precedentes, que l'on effectue de facon connue des essais de transcription de ladite 
cible en utilisant comme brin non-matrice les oligonucleotides obtenus, et que l'on elimine les 
oligonucleotides qui ne permettent pas d'effectuer ladite transcription avec un rendement au moins 
egal a un seuil predetermine. 

6. Utilisation d'un oligonucleotide tel que defini dans l'une quelconque des 

10 revendications 1 a 4 comme brin non matrice dans la transcription, en presence d'une ARN 
polymerase, a partir d'un site qui n'est normalement pas un site de debut de transcription pour 
ladite ARN polymerase, d'une sequence d'une cible nucleotidique capable de s'hybrider avec ledit 
oligonucleotide. 
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SEQONO: NO* 



STRUCTURES AON 



E- t -a 1 :!..-..;-.-,-:-.! ATT AT \w~<**>*»< » TaT ^ -<> - ~-<^ 



Umgu«ur AON 




Longueur Aft 


Ntrwocrfts 


brin* 


26b 


29b 33b 


36b 36b 41b 


brin- 








41 









41 



3 AM- fVw.w-KWVI-v ■ . 1 TaT ic^^v^^ ^^^^m 



, ^ t^ M ]TAATA V' X.* w IaT A If^g 



, £ , I:::-':: :^TAA!A t |aTA |^f - 

S AA- r,,,.AVV^::::,::,L^^^-^ 



2 E- fy;-=. UHaTT 



.IaTaIq ) 



"ITAT 14; , 



58 



^■•^••■•fcAXSJ- 



"1 ata If ,,) 



I ATTAT \ 



UTAB I 



36 

55 



am, I N\SSE 

AA- | 



IaYaI&- : I 



36 n=n 



7 A w \ jTAATA £ 

2 e- i um rr 



HTaTE 



I . . IYaaYaT 



'TAT 1C: 



AW t : HAAVA I 3 

AV- (■ ■„■ ,■ lATTAT t 1 -.-^!-^: •^S.NC-v-::: -^ 



38 



•■- .•'-• ' ■• I 



t ; UaaTa t 



A*- I iVWI 



am t KVAI 

E " t Iattat F 



' two- . I 



iTATlC 



am- r IVVM 



iTATlCi: 



aa, h NVs>V 
av- i. ... uttat i 



33 rvn 

55 



aa* ' IW^H ■ 



2714062 



S£Q © NO: MOM: 



£• 



r 



3/5 

FIGURE 4 
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FIGURE 5 
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FIGURE 6 
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